期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于神经耦合模型的异构词法数据转化和融合
黄德朋, 李正华, 龚晨, 张民
北京大学学报自然科学版    2020, 56 (1): 97-104.   DOI: 10.13209/j.0479-8023.2019.098
摘要800)   HTML    PDF(pc) (673KB)(119)    收藏
为了扩大人工标注数据的规模, 从而提高模型性能, 尝试充分利用已有的异构人工标注数据训练模型参数。将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架, 直接在两个异构训练数据上训练参数, 测试阶段则同时预测两个标签序列。在词性标注、分词词性联合标注两个任务上进行大量实验, 结果表明, 与多任务学习方法和传统耦合模型相比, 神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能。
相关文章 | 多维度评价 | 评论0
2. 句法增强的UCCA语义分析方法
蒋炜, 李正华, 张民
北京大学学报自然科学版    2020, 56 (1): 89-96.   DOI: 10.13209/j.0479-8023.2019.099
摘要1147)   HTML    PDF(pc) (644KB)(126)    收藏
考虑到句法结构与语义结构之间的紧密联系, 尝试将句法信息融入UCCA语义分析模型中来增强语义分析的性能。基于目前性能最好的基于图的 UCCA语义分析模型, 提出并比较4种不同的融入依存句法信息的方法。采用SemEval-2019国际评测语义分析任务的英文数据集进行实验, 在本领域和跨领域两个数据集上的结果均表明, 句法增强的方法能够给显著地提高UCCA分析性能。引入BERT特征后, 句法信息仍然可以提供一定的帮助。
相关文章 | 多维度评价 | 评论0
3. 基于词模式嵌入的词语上下位关系分类
孙佳伟, 李正华, 陈文亮, 张民
北京大学学报自然科学版    2019, 55 (1): 1-7.   DOI: 10.13209/j.0479-8023.2018.055
摘要1347)   HTML    PDF(pc) (4709KB)(315)    收藏

提出一种基于词模式的上下位关系分类方法, 可以有效地缓解传统的基于模式的分类方法存在的稀疏问题, 提高了关系分类的召回率。进一步地, 通过词模式嵌入, 将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性, 标注一个包含12000个汉语词语对的数据集。实验结果表明, 该词模式嵌入方法是有效的, F1值可以达到95.36%。

相关文章 | 多维度评价 | 评论0
4. 面向词性标注的多资源转化研究
高恩婷,巢佳媛,李正华
北京大学学报(自然科学版)   
摘要972)      PDF(pc) (568KB)(215)    收藏
利用多资源转化方法进行词性标注研究, 旨在将源端资源的标注进行转化, 以符合目标端标注规范, 进而将转化后的资源与目标资源合并, 增大训练数据规模。做了两方面创新: 在转化过程中, 额外利用指导特征的置信度信息; 在转化后的资源中, 用模糊标注表示方法减少错误标注。实验表明, 利用置信度信息能有效帮助转化, 而模糊标注表示方法的影响不大。
相关文章 | 多维度评价 | 评论0